本帖最後由 馬拉一個錘子 於 10-11-2025 12:15 PM 編輯
凡事總有過程,是先改善質量,弄清規則,再考慮擴增,而非反過來,我相信本碼表是日後擴增的良好基礎,它已經包含了常用字,和大量的罕用字,不包括Unicode尚沒有的字,實際收字也有五萬九千多字呢。
如果碼表存在大量衝突矛盾的編碼,同樣不能打出字。就像「萨」在坊間編碼「TNLY」,利用了「产」輔助字形,而「铲」卻編碼「OPYTH」,沒有使用「产」輔助字形。「奡」編碼「MUKLL」,「𬛬」却又編碼「HUKL」。「啻」編碼「YBLBR」,而「𬃨」卻編碼「YBLD」。這種錯誤衝突的編碼會讓使用者無所適從,即使碼表有收字,無法通過正常的規則和輔助字形知道該字在該碼表中的真正編碼,也無法打出字。
補全字集屬於另一項獨立的工作,而本專案的目標就是將《內碼對照表》文本化,還原原貌,這樣才能方便研究規則、為擴增打好基礎。我們十分認同大家補全字集的建議,我們的任務尚未完成,我們會繼續努力。